AI资讯新闻榜单内容搜索-scaling la

OpenAI去年挖的坑填上了！奖励模型首现Scaling Law，1.8B给70B巨兽上了一课

最近，一款全新的奖励模型「POLAR」横空出世。它开创性地采用了对比学习范式，通过衡量模型回复与参考答案的「距离」来给出精细分数。不仅摆脱了对海量人工标注的依赖，更展现出强大的Scaling潜力，让小模型也能超越规模大数十倍的对手。

来自主题: AI技术研报

5570 点击 2025-07-11 16:30

Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率，华为诺亚提出代码HLCE终极基准

大语言模型（LLM）在标准编程基准测试（如 HumanEval,Livecodebench）上已经接近 “毕业”，但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力？

来自主题: AI技术研报

6054 点击 2025-07-07 10:39

原来Scaling Law还能被优化？Meta这招省token又提效

2017 年，一篇《Attention Is All You Need》论文成为 AI 发展的一个重要分水岭，其中提出的 Transformer 依然是现今主流语言模型的基础范式。尤其是在基于 Transformer 的语言模型的 Scaling Law 得到实验验证后，AI 领域的发展更是进入了快车道。

来自主题: AI技术研报

5928 点击 2025-07-06 14:56

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

最近，关于大模型推理的测试时间扩展（Test time scaling law ）的探索不断涌现出新的范式，包括① 结构化搜索结（如 MCTS），② 过程奖励模型（Process Reward Model ）+ PPO，③ 可验证奖励（Verifiable Reward）+ GRPO（DeepSeek R1）。

来自主题: AI技术研报

6326 点击 2025-07-04 09:44

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

在我们去年 AI Scaling Laws article from late last year中，我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展，使得模型能力的增长速度超过了摩尔定律，并且单位 token 成本也相应地迅速降低。

来自主题: AI技术研报

6085 点击 2025-06-24 11:09

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

CVPR 2025，自动驾驶传来重大进展： Scaling Law，首次在这条赛道被验证！

来自主题: AI资讯

5655 点击 2025-06-17 10:35

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

不去今年的CVPR不知道，原来中国自动驾驶在AI领域的创新已经这么牛了。作为今年唯一受邀参与CVPR演讲的车企，这家公司在AI顶流圈层上桌吃饭了！

来自主题: AI资讯

7855 点击 2025-06-16 16:52

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

既能提升模型能力，又不显著增加内存和时间成本，LLM第三种Scaling Law被提出了。

来自主题: AI技术研报

7008 点击 2025-05-28 14:21

她如何把“系统2”带给了大模型｜对话微软亚洲研究院张丽

2023年，业界还在卷Scaling Law，不断突破参数规模和数据规模时，微软亚洲研究院张丽团队就选择了另一条路径。

来自主题: AI技术研报

5914 点击 2025-05-26 14:35

AI大厦需要新的地基！

「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了

来自主题: AI资讯

7120 点击 2025-05-19 14:03

AI资讯新闻榜单内容搜索-scaling la

OpenAI去年挖的坑填上了！奖励模型首现Scaling Law，1.8B给70B巨兽上了一课

Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率，华为诺亚提出代码HLCE终极基准

原来Scaling Law还能被优化？Meta这招省token又提效

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

NVIDIA Tensor Core 的演变：从 Volta 到 Blackwell

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

CVPR史上首次！中国车厂主讲AI大模型，自动驾驶也玩Scaling Law?

阿里通义发布并行计算新策略：1.6B等效4.4B，内存消耗骤降95%

她如何把“系统2”带给了大模型 ｜对话微软亚洲研究院张丽

AI大厦需要新的地基！

她如何把“系统2”带给了大模型｜对话微软亚洲研究院张丽